智能论文笔记

Truncated Matrix Power Iteration for Differentiable DAG Learning

Zhen Zhang , Ignavier Ng , Dong Gong , Yuhang Liu , Ehsan M Abbasnejad , Mingming Gong , Kun Zhang , Javen Qinfeng Shi

分类：机器学习 | 人工智能 | (统计)机器学习

2022-08-30

从观察数据中恢复基本的定向无环形结构（DAG），由于DAG受限的优化问题的组合性质，因此极具挑战性。最近，通过将DAG约束将DAG的限制定义为平滑的平等性，通常基于邻接矩阵上的多项式，将DAG学习作为连续优化问题。现有方法将非常小的系数放在高阶多项式术语上以进行稳定，因为它们认为由于数字爆炸而导致高阶项上的大系数有害。相反，我们发现，高阶术语上的大系数对DAG学习有益，当邻接矩阵的光谱辐射小时，高阶术语的较大系数可以比小尺寸近似于小的限制。同行。基于此，我们提出了一种具有有效截短的矩阵功率迭代的新型DAG学习方法，以近似于基于几何序列的DAG约束。从经验上讲，我们的DAG学习方法在各种环境中的表现优于先前的最新方法，在结构锤距离上通常以3倍或以上的倍数。

translated by 谷歌翻译

Stock Market Prediction via Deep Learning Techniques: A Survey

Jinan Zou , Qingying Zhao , Yang Jiao , Haiyao Cao , Yanxi Liu , Qingsen Yan , Ehsan Abbasnejad , Lingqiao Liu , Javen Qinfeng Shi

分类：人工智能

2022-12-24

The stock market prediction has been a traditional yet complex problem researched within diverse research areas and application domains due to its non-linear, highly volatile and complex nature. Existing surveys on stock market prediction often focus on traditional machine learning methods instead of deep learning methods. Deep learning has dominated many domains, gained much success and popularity in recent years in stock market prediction. This motivates us to provide a structured and comprehensive overview of the research on stock market prediction focusing on deep learning techniques. We present four elaborated subtasks of stock market prediction and propose a novel taxonomy to summarize the state-of-the-art models based on deep neural networks from 2011 to 2022. In addition, we also provide detailed statistics on the datasets and evaluation metrics commonly used in the stock market. Finally, we highlight some open issues and point out several future directions by sharing some new perspectives on stock market prediction.

translated by 谷歌翻译

Bayesian Learning with Information Gain Provably Bounds Risk for a Robust Adversarial Defense

Bao Gia Doan , Ehsan Abbasnejad , Javen Qinfeng Shi , Damith C. Ranasinghe

分类：机器学习 | 计算机视觉

2022-12-05

We present a new algorithm to learn a deep neural network model robust against adversarial attacks. Previous algorithms demonstrate an adversarially trained Bayesian Neural Network (BNN) provides improved robustness. We recognize the adversarial learning approach for approximating the multi-modal posterior distribution of a Bayesian model can lead to mode collapse; consequently, the model's achievements in robustness and performance are sub-optimal. Instead, we first propose preventing mode collapse to better approximate the multi-modal posterior distribution. Second, based on the intuition that a robust model should ignore perturbations and only consider the informative content of the input, we conceptualize and formulate an information gain objective to measure and force the information learned from both benign and adversarial training instances to be similar. Importantly. we prove and demonstrate that minimizing the information gain objective allows the adversarial risk to approach the conventional empirical risk. We believe our efforts provide a step toward a basis for a principled method of adversarially training BNNs. Our model demonstrate significantly improved robustness--up to 20%--compared with adversarial training and Adv-BNN under PGD attacks with 0.035 distortion on both CIFAR-10 and STL-10 datasets.

translated by 谷歌翻译

ID and OOD Performance Are Sometimes Inversely Correlated on Real-world Datasets

Damien Teney , Seong Joon Oh , Ehsan Abbasnejad

分类：机器学习 | 计算机视觉

2022-09-01

几项研究在经验上比较了各种模型的分布（ID）和分布（OOD）性能。他们报告了计算机视觉和NLP中基准的频繁正相关。令人惊讶的是，他们从未观察到反相关性表明必要的权衡。这重要的是确定ID性能是否可以作为OOD概括的代理。这篇简短的论文表明，ID和OOD性能之间的逆相关性确实在现实基准中发生。由于模型的选择有偏见，因此在过去的研究中可能被错过。我们使用来自多个训练时期和随机种子的模型展示了Wilds-Amelyon17数据集上模式的示例。我们的观察结果尤其引人注目，对经过正规化器训练的模型，将解决方案多样化为ERM目标。我们在过去的研究中得出了细微的建议和结论。（1）高OOD性能有时确实需要交易ID性能。（2）仅专注于ID性能可能不会导致最佳OOD性能：它可能导致OOD性能的减少并最终带来负面回报。（3）我们的示例提醒人们，实证研究仅按照现有方法来制定制度：在提出规定的建议时有必要进行护理。

translated by 谷歌翻译

Multiple Instance Neuroimage Transformer

Ayush Singla , Qingyu Zhao , Daniel K. Do , Yuyin Zhou , Kilian M. Pohl , Ehsan Adeli

分类：计算机视觉 | 机器学习

2022-08-19

我们首次建议使用基于多个实例学习的无卷积变压器模型，称为多个实例神经图像变压器（Minit），以分类T1Weighted（T1W）MRIS。我们首先介绍了为神经图像采用的几种变压器模型。这些模型从输入体积提取非重叠的3D块，并对其线性投影进行多头自我注意。另一方面，Minit将输入MRI的每个非重叠的3D块视为其自己的实例，将其进一步分为非重叠的3D贴片，并在其上计算了多头自我注意力。作为概念验证，我们通过训练模型来评估模型的功效，以确定两个公共数据集的T1W-MRIS：青少年脑认知发展（ABCD）和青少年酒精和神经发展联盟（NCANDA）（NCANDA）。博学的注意力图突出了有助于识别脑形态计量学性别差异的体素。该代码可在https://github.com/singlaayush/minit上找到。

translated by 谷歌翻译

Bridging the Gap between Deep Learning and Hypothesis-Driven Analysis via Permutation Testing

Magdalini Paschali , Qingyu Zhao , Ehsan Adeli , Kilian M. Pohl

分类：机器学习

2022-07-28

神经科学研究的一种基本方法是基于神经心理学和行为措施，即某些因素（例如，与生活事件相关）是否与结果（例如抑郁症）有关。近年来，深度学习已成为通过预测一系列因素的结果并确定推动预测的最“信息性”的结果，成为进行此类分析的潜在替代方法。但是，这种方法的影响有限，因为其发现与支持假设的因素的统计意义无关。在本文中，我们根据排列测试的概念提出了一种灵活且可扩展的方法，该方法将假设检验集成到数据驱动的深度学习分析中。我们将我们的方法应用于对青春期酒精和神经发育联盟（NCANDA）的621名青少年参与者的年度自我报告评估，以预测负面价，这是根据NIMH研究领域标准（RDOC）的重大抑郁症的症状。我们的方法成功地识别了进一步解释症状的危险因素类别。

translated by 谷歌翻译

A Penalty Approach for Normalizing Feature Distributions to Build Confounder-Free Models

Anthony Vento , Qingyu Zhao , Robert Paul , Kilian M. Pohl , Ehsan Adeli

分类：机器学习 | 计算机视觉

2022-07-11

将机器学习算法转换为临床应用需要解决与解释性有关的挑战，例如考虑混杂变量（或元数据）的影响。混杂变量会影响输入训练数据和目标输出之间的关系。当我们在此类数据上训练模型时，混杂的变量会偏向于学习功能的分布。最近有前途的解决方案元数据归一化（MDN）估计了基于不可训练的封闭形式解决方案的元数据与每个特征之间的线性关系。但是，该估计受到迷你批量的样本量的限制，因此可能导致该方法在训练过程中不稳定。在本文中，我们通过应用罚款方法（称为PDMN）扩展了MDN方法。我们将问题投入到双层嵌套的优化问题中。然后，我们使用惩罚方法近似此优化问题，以便MDN层中的线性参数可以训练并在所有样本上学习。这使PMDN可以插入任何架构，甚至可以运行批处理级操作，例如变形金刚和经常性模型。我们在合成实验中使用PMDN和MDN的混杂因素和更大的独立性表现出了更大的独立性，并且在合成实验中和多标签的多站点的磁共振图像数据集（MRIS）。

translated by 谷歌翻译

Predicting is not Understanding: Recognizing and Addressing Underspecification in Machine Learning

Damien Teney , Maxime Peyrard , Ehsan Abbasnejad

分类：机器学习 | 计算机视觉

2022-07-06

机器学习（ML）模型通常是针对给定数据集的精度进行优化的。但是，此预测标准很少捕获模型的所有理想属性，特别是它与域专家对任务的理解的匹配程度。指定的是指多种模型的存在，这些模型在其内域准确性上是无法区分的，即使它们在其他期望的属性（例如分布（OOD）性能）上有所不同。确定这些情况对于评估ML模型的可靠性至关重要。我们正式化了指定的概念，并提出了一种识别和部分解决它的方法。我们训练多个模型具有独立约束，迫使他们实施不同的功能。他们发现了预测性特征，否则标准经验风险最小化（ERM）忽略了这些特征，然后我们将其提炼成具有出色OOD性能的全球模型。重要的是，我们限制了模型以与数据歧管保持一致，以确保它们发现有意义的功能。我们在计算机视觉（拼贴，wild-camelyon17，gqa）中演示了多个数据集的方法，并讨论了指定规定的一般含义。最值得注意的是，没有其他假设，内域性能无法用于OOD模型选择。

translated by 谷歌翻译

GaitForeMer: Self-Supervised Pre-Training of Transformers via Human Motion Forecasting for Few-Shot Gait Impairment Severity Estimation

Mark Endo , Kathleen L. Poston , Edith V. Sullivan , Li Fei-Fei , Kilian M. Pohl , Ehsan Adeli

分类：计算机视觉 | 机器学习

2022-06-30

帕金森氏病（PD）是一种神经系统疾病，具有各种可观察到的与运动相关的症状，例如运动缓慢，震颤，肌肉僵硬和姿势受损。 PD通常通过评估运动障碍系统（例如运动障碍协会统一帕金森氏病评级量表（MDS-UPDRS））的评分系统来诊断PD。使用个体视频记录的自动严重性预测为无侵入性监测运动障碍提供了有希望的途径。但是，PD步态数据的大小有限阻碍模型能力和临床潜力。由于这种临床数据的稀缺性，并受到自我监督的大规模语言模型（例如GPT-3）的最新进展的启发，我们将人类运动预测用作有效的自我监督预训练的任务来估计运动障碍的严重性。我们介绍步态预测和损伤估计变压器，该变压器首先在公共数据集中进行预测以预测步态运动，然后应用于临床数据以预测MDS-UPDRS步态障碍的严重性。我们的方法的表现优于以前的方法，这些方法仅依赖于临床数据，从而达到了0.76的F1得分，精度为0.79，召回率为0.75。使用GaitForemer，我们展示了公共人类运动数据存储库如何通过学习通用运动表示来帮助临床用例。该代码可从https://github.com/markendo/gaitforemer获得。

translated by 谷歌翻译

EBMs vs. CL: Exploring Self-Supervised Visual Pretraining for Visual Question Answering

Violetta Shevchenko , Ehsan Abbasnejad , Anthony Dick , Anton van den Hengel , Damien Teney

分类：计算机视觉 | 自然语言处理 | 机器学习

2022-06-29

清洁和不同标记的数据的可用性是培训复杂任务（例如视觉问答（VQA））的培训模型的主要障碍。大型视觉和语言模型的广泛工作表明，自我监督的学习对预处理多模式相互作用有效。在此技术报告中，我们专注于视觉表示。我们审查和评估自我监督的方法，以利用未标记的图像并预处理模型，然后我们对其进行了自定义VQA任务，该任务允许进行控制的评估和诊断。我们将基于能量的模型（EBM）与对比度学习（CL）进行比较。尽管EBM越来越受欢迎，但他们缺乏对下游任务的评估。我们发现，EBM和CL都可以从未标记的图像中学习表示形式，这些图像能够在很少的注释数据上训练VQA模型。在类似于CLEVR的简单设置中，我们发现CL表示还可以改善系统的概括，甚至匹配来自较大，监督，预测模型的表示的性能。但是，我们发现EBM由于不稳定性和结果差异很高而难以训练。尽管EBMS被证明对OOD检测有用，但基于监督的基于能量的训练和不确定性校准的其他结果在很大程度上是负面的。总体而言，CL当前似乎比EBM的选项更为可取。

translated by 谷歌翻译